home *** CD-ROM | disk | FTP | other *** search
/ Skunkware 5 / Skunkware 5.iso / man / cat.1 / ispell.1 < prev    next >
Text File  |  1995-07-25  |  20KB  |  397 lines

  1.  
  2.  
  3.  
  4.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  5.  
  6.  
  7.  
  8.      NNNNAAAAMMMMEEEE
  9.           ispell - Correct spelling for a file
  10.           munchlist - Combine suffixes in a spelling list
  11.           isexpand - Expand suffixes in a spelling list
  12.  
  13.      SSSSYYYYNNNNOOOOPPPPSSSSIIIISSSS
  14.           iiiissssppppeeeellllllll [ ----tttt | ----xxxx | ----SSSS | ----dddd file | ----pppp file | ----wwww chars ] file
  15.           .....
  16.           iiiissssppppeeeellllllll [ ----tttt | ----dddd file | ----pppp file | ----wwww chars ] ----llll
  17.           iiiissssppppeeeellllllll [ ----tttt | ----dddd file | ----pppp file ] { ----aaaa | ----AAAA }
  18.           iiiissssppppeeeellllllll [ ----wwww chars ] ----cccc
  19.           iiiissssppppeeeellllllll ----vvvv
  20.           mmmmuuuunnnncccchhhhlllliiiisssstttt [ ----dddd file | ----eeee | ----wwww chars ] [ files ]
  21.           iiiisssseeeexxxxppppaaaannnndddd [ files ]
  22.  
  23.      DDDDEEEESSSSCCCCRRRRIIIIPPPPTTTTIIIIOOOONNNN
  24.           _I_s_p_e_l_l is fashioned after the _s_p_e_l_l program from ITS (called
  25.           _i_s_p_e_l_l on Twenex systems.)  The most common usage is "ispell
  26.           filename".  In this case, _i_s_p_e_l_l will display each word
  27.           which does not appear in the dictionary, and allow you to
  28.           change it.  If there are "near misses" in the dictionary
  29.           (words which differ by only a single letter, a missing or
  30.           extra letter, or a pair of transposed letters), then they
  31.           are also displayed.  If you think the word is correct as it
  32.           stands, you can type either "Space" to accept it this one
  33.           time, or "I" to accept it and put it in your private
  34.           dictionary.  If one of the near misses is the word you want,
  35.           type the corresponding number.  (If there are more than 10
  36.           choices, you may have to type a carriage return to complete
  37.           a single-digit number).  Finally, if none of these choices
  38.           is right, you can type "R" and you will be prompted for a
  39.           replacement word.  If you want to see a list of words that
  40.           might be close using wildcard characters, type "L" to lookup
  41.           a word in the system dictionary.
  42.  
  43.           When a misspelled word is found, it is printed at the top of
  44.           the screen.  Any near misses will be printed on the
  45.           following lines, and finally, two lines containing the word
  46.           are printed at the bottom of the screen.  If your terminal
  47.           can type in reverse video, the word itself is highlighted.
  48.  
  49.           The ----vvvv option causes _i_s_p_e_l_l to print its current version
  50.           identification on the standard output and exit.
  51.  
  52.           The ----llll or "list" option to _i_s_p_e_l_l is used to produce a list
  53.           of misspelled words from the standard input.
  54.  
  55.           The ----aaaa option is intended to be used from other programs
  56.           through a pipe.  In this mode, _i_s_p_e_l_l expects the standard
  57.           input to consist of lines containing single words.  Each
  58.           word is read, and a single line is written to the standard
  59.           output.  If the word was found in the main dictionary, or
  60.  
  61.  
  62.  
  63.      Page 1                                           (printed 3/9/94)
  64.  
  65.  
  66.  
  67.  
  68.  
  69.  
  70.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  71.  
  72.  
  73.  
  74.           your personal dictionary, then the line contains only a '*'.
  75.           If the word was found through suffix removal, then the line
  76.           contains a '+', a space, and the root word.  If the word is
  77.           not in the dictionary, but there are near misses, then the
  78.           line contains an '&', a space, and a list of the near misses
  79.           separated by spaces.  Also, each near miss is capitalized
  80.           the same as the input word if unless such capitalization is
  81.           illegal; in the latter case each near miss is capitalized
  82.           correctly according to the dictionary.  Finally, if the word
  83.           neither appears in the dictionary, and there are no near
  84.           misses, then the line contains only a '#'.  This mode is
  85.           also suitable for interactive use when you want to figure
  86.           out the spelling of a single word.  (These characters are
  87.           the same as the codes that the real spell program uses.)
  88.  
  89.           The ----AAAA option works just like ----aaaa, except that if a line
  90.           begins with the string "&Include_File&", the rest of the
  91.           line is taken as the name of a file to read for further
  92.           words.  Input returns to the original file when the include
  93.           file is exhausted.  Inclusion may be nested up to five deep.
  94.           The key string may be changed with the environment variable
  95.           IIIINNNNCCCCLLLLUUUUDDDDEEEE____SSSSTTTTRRRRIIIINNNNGGGG (the ampersands, if any, must be included).
  96.  
  97.           When in the ----aaaa mode, _i_s_p_e_l_l will also accept lines of single
  98.           words prefixed with either a '*' or a '@'.  A line starting
  99.           with '*' tells _i_s_p_e_l_l to insert the word into the user's
  100.           dictionary (similar to the I command).  A line starting with
  101.           '@' causes _i_s_p_e_l_l to accept this word in the future (similar
  102.           to the A command).
  103.  
  104.           The ----xxxx option causes _i_s_p_e_l_l to remove the .bak file that it
  105.           normally leaves.  The .bak file contains the pre-corrected
  106.           text.  If there are file opening / writing errors, the .bak
  107.           file may be left for recovery purposes even with the -x
  108.           option.
  109.  
  110.           The ----SSSS option suppresses _i_s_p_e_l_l's normal behavior of sorting
  111.           the list of possible replacement words.  Some people may
  112.           prefer this, since it somewhat enhances the probability that
  113.           the correct word will be low-numbered.
  114.  
  115.           The ----tttt option selects TeX/LaTeX input mode.  TeX/LaTeX mode
  116.           is also automatically selected if an input file has the
  117.           extension ".tex".  In this mode, whenever a backslash ("\")
  118.           is found, _i_s_p_e_l_l will skip to the next whitespace.  Thus,
  119.           for example, given
  120.                \chapter {This is a Ckapter} \cite{SCH86}
  121.           will find "Ckapter" but will not look for SCH.  The ----tttt
  122.           option does not recognize the TeX comment character "%".
  123.  
  124.           The ----dddd option is used to specify an alternate hashed
  125.           dictionary file, other than the default.  If the filename
  126.  
  127.  
  128.  
  129.      Page 2                                           (printed 3/9/94)
  130.  
  131.  
  132.  
  133.  
  134.  
  135.  
  136.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  137.  
  138.  
  139.  
  140.           does not begin with a "/", the library directory for the
  141.           default dictionary file is prefixed.  This is useful to
  142.           allow dictionaries which prefer alternate British spellings
  143.           ("centre", "tyre", etc), or add lists of special-purpose
  144.           jargon and acronyms for subclasses of documents.  There are
  145.           some shortcomings in attempting to provide foreign-language
  146.           dictionaries, but something like "-d french" could be made
  147.           to work somewhat.  The ----dddd option may specify /_d_e_v/_n_u_l_l, in
  148.           which case the dictionary is limited to the personal one.
  149.           This may be useful for certain private dictionaries.
  150.  
  151.           The ----pppp option is used to specify an alternate personal
  152.           dictionary file.  If the file name does not begin with "/",
  153.           $HOME is prefixed.  Also, the shell variable WORDLIST may be
  154.           set, which renames the personal dictionary in the same
  155.           manner.  The command line overrides WORDLIST setting.  If
  156.           neither is present "~/.ispell_words" is used.
  157.  
  158.           The ----wwww option may be used to specify characters other than
  159.           alphabetics which may also appear in words.  For instance,
  160.           ----wwww "&" will allow "AT&T" to be picked up.  Underscores are
  161.           useful in many technical documents.  There is an admittedly
  162.           crude provision in this option for 8-bit international
  163.           characters.  Non-printing characters may be specified in the
  164.           usual way by inserting a backslash followed by the octal
  165.           character code; e.g., "\014" for a form feed.
  166.           Alternatively, if "n" appears in the character string, the
  167.           (up to) three characters following are a DECIMAL code 0 -
  168.           255, for the character.  For example, to include bells and
  169.           form feeds in your words (an admittedly silly thing to do,
  170.           but aren't most pedagogical examples):
  171.  
  172.           n007n012
  173.  
  174.           Numeric digits other than the three following "n" are simply
  175.           numeric characters.  Use of "n" does not conflict with
  176.           anything because actual alphabetics have no meaning -
  177.           alphabetics are already accepted.  _I_s_p_e_l_l will typically be
  178.           used with input from a file, meaning that preserving parity
  179.           for possible 8 bit characters from the input text is OK.  If
  180.           you specify the -l option, and actually type text from the
  181.           terminal, this may create problems if your stty settings
  182.           preserve parity.
  183.  
  184.           The ----cccc option is primarily intended for use by the _m_u_n_c_h_l_i_s_t
  185.           shell script.  In this mode, a list of words is read from
  186.           the standard input.  For each word, a list of possible root
  187.           words and suffixes will be written to the standard output.
  188.           Some of the root words will be illegal and must be filtered
  189.           from the output by other means; the _m_u_n_c_h_l_i_s_t script does
  190.           this.  As an example, the command "echo BOTHER | ispell -c"
  191.           produces:
  192.  
  193.  
  194.  
  195.      Page 3                                           (printed 3/9/94)
  196.  
  197.  
  198.  
  199.  
  200.  
  201.  
  202.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  203.  
  204.  
  205.  
  206.                BOTH
  207.                BOTHE/R
  208.                BOTH/R
  209.  
  210.           Unless it has been installed without the feature by your
  211.           system administrator, _i_s_p_e_l_l is aware of the correct
  212.           capitalizations of words in the dictionary and in your
  213.           personal dictionary.  As well as recognizing words that must
  214.           be capitalized (e.g., George) and words that must be all-
  215.           capitals (e.g., NASA), it can also handle words with
  216.           "unusual" capitalization (e.g., "ITCorp" or "TeX").  If a
  217.           word is capitalized incorrectly, the list of possibilities
  218.           will include all acceptable capitalizations.  (More than one
  219.           capitalization may be acceptable; for example, my dictionary
  220.           lists both "ITCorp" and "ITcorp".) Normally, this feature
  221.           will not cause you surprises, but there is one circumstance
  222.           you need to be aware of.  If you add a word to your
  223.           dictionary that is at the beginning of a sentence (e.g., the
  224.           first word of this paragraph if "unless" were not in the
  225.           dictionary), it will be marked as "capitalization required".
  226.           A subsequent usage of this word without capitalization
  227.           (e.g., the quoted word in the previous sentence), _i_s_p_e_l_l
  228.           will object and suggest the capitalized version.  You must
  229.           then compare the actual spellings by eye, and then type "I"
  230.           to add the un-capitalized variant to your personal
  231.           dictionary.
  232.  
  233.           The rules for capitalization are as follows:
  234.  
  235.           (1)  Any word may appear in all capitals, as in headings.
  236.  
  237.           (2)  Any word that is in the dictionary in all-lowercase
  238.                form may appear either in lowercase or capitalized (as
  239.                at the beginning of a sentence).
  240.  
  241.           (3)  Any word that has "funny" capitalization (i.e., it
  242.                contains both cases and there is an uppercase character
  243.                besides the first) must appear exactly as in the
  244.                dictionary, except as permitted by rule (1).  If the
  245.                word is acceptable in all-lowercase, it must appear
  246.                thus in a dictionary entry.
  247.  
  248.           The _m_u_n_c_h_l_i_s_t shell script is used to reduce the size of
  249.           dictionary files, primarily personal dictionary files.  It
  250.           is also capable of combining dictionaries from various
  251.           sources.  The given _f_i_l_e_s are read (standard input if no
  252.           arguments are given), reduced to a minimal set of roots and
  253.           suffixes that will match the same list of words, and written
  254.           to standard output.
  255.  
  256.           Normally, words that are in the default dictionary are
  257.           removed by _m_u_n_c_h_l_i_s_t during processing.  If the list is to
  258.  
  259.  
  260.  
  261.      Page 4                                           (printed 3/9/94)
  262.  
  263.  
  264.  
  265.  
  266.  
  267.  
  268.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  269.  
  270.  
  271.  
  272.           be used with a different dictionary, the ----dddd option can be
  273.           used to specify an alternate (hashed) dictionary file
  274.           containing words to be removed from the output list.  If a
  275.           dictionary file of /_d_e_v/_n_u_l_l is specified, no words will be
  276.           removed from the output; this is useful when munching the
  277.           primary dictionary file.
  278.  
  279.           The ----wwww option is passed on to _i_s_p_e_l_l.  The ----eeee ("efficient")
  280.           option causes the script to use a slower algorithm that uses
  281.           somewhat less space in TMPDIR (normally /_u_s_r/_t_m_p).
  282.  
  283.           The _i_s_e_x_p_a_n_d shell script is used to expand the various
  284.           suffix flags in an _i_s_p_e_l_l word list.  This script can be
  285.           used when looking words up in the dictionary, or to verify
  286.           that a particular suffix flag actually produces the expected
  287.           result.
  288.  
  289.           It is possible to install _i_s_p_e_l_l in such a way as to only
  290.           support ASCII range text if desired.
  291.  
  292.      EEEENNNNVVVVIIIIRRRROOOONNNNMMMMEEEENNNNTTTT
  293.           WORDLIST       Personal dictionary file name
  294.           INCLUDE_STRING      Code for file inclusion under the -A
  295.           option
  296.           TMPDIR         Directory used for some of munchlist's
  297.           temporary files
  298.  
  299.      FFFFIIIILLLLEEEESSSS
  300.           $HOME/.ispell_words      user's private dictionary
  301.           /usr/dict/words          list of words for the Lookup
  302.           function
  303.           /_t_o_o_l_s/_s_o_u_r_c_e_s/_i_s_p_e_l_l           directory for the following
  304.           files:
  305.           ispell.hash         hashed dictionary for ispell
  306.           isexp[1-4].sed      sed scripts for expanding suffixes
  307.           icombine       program for combining suffix flags
  308.           munchlist      munchlist program
  309.           isexpand       isexpand program
  310.           makedict*      making your own dictionaries
  311.           fixdict        fix capitalization in dictionary
  312.           ispell.4.hlp        description of dictionary entries
  313.           ispell.el      sample GNU Emacs interface to ispell
  314.  
  315.      SSSSEEEEEEEE AAAALLLLSSSSOOOO
  316.           spell(1), egrep(1), look(1), ispell(4)
  317.  
  318.      BBBBUUUUGGGGSSSS
  319.           It takes about five seconds for _i_s_p_e_l_l to read in the hash
  320.           table.
  321.  
  322.           The hash table is stored as a quarter-megabyte (or larger)
  323.           array, so a PDP-11 version does not seem likely.
  324.  
  325.  
  326.  
  327.      Page 5                                           (printed 3/9/94)
  328.  
  329.  
  330.  
  331.  
  332.  
  333.  
  334.      IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))          UUUUNNNNIIIIXXXX SSSSyyyysssstttteeeemmmm VVVV ((((MMMMIIIITTTT))))          IIIISSSSPPPPEEEELLLLLLLL((((llllooooccccaaaallll))))
  335.  
  336.  
  337.  
  338.           _I_s_p_e_l_l should understand more _t_r_o_f_f syntax, and deal more
  339.           intelligently with contractions.
  340.  
  341.           While alternate dictionaries for foreign languages could be
  342.           defined, and the international characters included in words,
  343.           rules concerning word endings / pluralization accommodate
  344.           English only.
  345.  
  346.           When the ----xxxx flag is specified, _i_s_p_e_l_l will unlink any
  347.           existing .bak file.
  348.  
  349.           _M_u_n_c_h_l_i_s_t requires tremendous amounts of temporary file
  350.           space for large dictionaries.  It does respect the TMPDIR
  351.           environment variable, so this space can be redirected.
  352.           However, a lot of the temporary space it needs is for
  353.           sorting, so TMPDIR is only a partial help on systems with an
  354.           uncooperative _s_o_r_t(1).  As a benchmark, the 15000-word
  355.           _d_i_c_t._1_9_1 takes about 1200 blocks in TMPDIR, and 2000 in
  356.           _s_o_r_t's temporary directories.  Munching _d_i_c_t._1_9_1 with
  357.           /_u_s_r/_d_i_c_t/_w_o_r_d_s (28000 words output) took another 1500
  358.           blocks or so, and ran for the better part of an hour.
  359.  
  360.      AAAAUUUUTTTTHHHHOOOORRRR
  361.           Pace Willisson (pace@mit-vax)
  362.           Collected, revised, and enhanced for the Usenet by Walt
  363.           Buehring.
  364.           Further enhanced and debugged by Isaac Balbin, Stewart
  365.           Clamen, Mark Davies, Steve Dum, Gary Johnson, Don Kark,
  366.           Steve Kelem, Jim Knutson, Geoff Kuenning, Evan Marcus, Dave
  367.           Mason, Rob McMahon, Bob McQueer, David Neves, Joe Orost,
  368.           Israel Pinkas, Gary Puckering, Bill Randle, Marc Ries, Rich
  369.           Salz, Greg Schaffer, Joel Shprentz, George Sipe, Perry
  370.           Smith, Stefan Taxhet, Andrew Vignaux, Johan Widen, James
  371.           Woods, and Ken Yap.
  372.  
  373.  
  374.  
  375.  
  376.  
  377.  
  378.  
  379.  
  380.  
  381.  
  382.  
  383.  
  384.  
  385.  
  386.  
  387.  
  388.  
  389.  
  390.  
  391.  
  392.  
  393.      Page 6                                           (printed 3/9/94)
  394.  
  395.  
  396.  
  397.